# -*- coding = utf-8 -*-
# @Time : 2021/11/17 16:04
# @Author : ChenXingJia
# @File : spider.py

import sys
from bs4 import BeautifulSoup        # 网页解析，获取数据
import re                            # 正则表达式 进行文字匹配
import urllib.request, urllib.error  # 指定url，获取网页数据
import xlwt                          # 进行excel操作
import sqlite3                       # 进行Sqllite数据库操作


def main():

    base_url = 'https://movie.douban.com/top250'

    # 1.爬取网页
    dataList = get_data(base_url)

    # 2.解析数据

    # 3.保存数据
    savePath = '.\\douban_top250.xls'
    save_data(savePath)


# 爬取网页
def get_data(base_url):
    data_list = []
    return data_list


# 保存数据
def save_data(save_path):
    return

